Loading...

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편7

factor로 집단을 정의하고 벡터를 factor에 의해 집단으로 분할 split(벡터, factor)함수를 이용 tapply(vec,factor,func)를 이용하여 집단별로 함수를 적용한다 > v w f groups groups $A [1] 24 23 25 $B [1] 52 46 $C [1] 75 > groups2 groups2 $A [1] 87 86 68 $B [1] 92 84 $C [1] 77 > groups3 groups3 $A [1] 24 23 25 $B [1] 52 46 $C [1] 75 > tapply(v,f,mean) A B C 24 49 75 > tapply(w,f,sum) A B C 241 176 77 데이터프레임을 여러 집단으로 분할하기 역시 split(벡터, factor)함수를 이..

데이터분석 전문가(ADP)를 위한 R 프로그래밍 기초편6

1. 문자열 다루기 nchar(var) 단어나 문장 또는 벡터내 원소의 문자열 길이를 반환 벡터를 넣을경우 문자열의 길이가 아니라 벡터내 원소들의 문자열 길이를 벡터로 반환 > nchar('abcdefg') [1] 7 > nchar(c(1,2,3,4,5,6)) [1] 1 1 1 1 1 1 > nchar(c('ab',1,2,3,'abcdef')) [1] 2 1 1 1 6 paste(단어1, 단어2, sep=, collapse=) 주어진 문자열들을 sep를 연결해서 출력함 collapse는 벡터들을 연결해서 연결되는 결과가 여러개가 나오는경우 collapse에서 지정한 문자로 이들을 연결시켜서 하나로 만든다 > paste('taeyeon','love',sep='-') [1] "taeyeon-love" > p..

2022. 2. 8. 01:28

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편5

1. 데이터프레임 데이터에서 각각의 변수에 해당하는 열들의 모임 data.frame(벡터, 벡터, 벡터, ...) 벡터들로 데이터셋을 생성함 혹은 열 변수벡터로 데이터셋을 생성 혹은 data.frame(변수1이름=값, 변수2이름=값, 변수3이름=값,.....) > a b c d d a b c 1 1 5 9 2 2 6 10 3 3 7 11 4 4 8 12 > new new a b c d 1 1 2 3 a N=100 > dtfm dtfm$lab [1] "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" [42] "" "" "" "" "" ""..

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편4

1. 벡터 벡터의 원소들은 동질적 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드(mode)를 가진다. 예를 들어 문자형과 수치형을 넣으면 모두 문자형으로 통일된다 > v v [1] "yun" "13" "22" 벡터는 위치로 indexing가능 v[2]는 v의 2번째 원소 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다 v[c(2,3)]은 v벡터의 2번째, 3번째 원소로 구성된 하위벡터 인덱스에 -를 붙이면 해당 번호는 제외한 나머지 번호의 원소를 가져옴 v[-c(2,3)]은 2,3번째 값을 제외한 하위벡터 > v v[2] [1] 21 > v[c(2,3)] [1] 21 42 > v[-c(2,3)] [1] 33 32 5 4 432 21 벡터의 원소들도 이름을 가질 수 있다 >..

2022. 2. 5. 04:07

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편3

1. scan scan('파일이름')을 통해 단순한 벡터 형태의 파일을 읽어들인다 > scan('/cloud/project/file.txt') Read 3 items [1] 123 4 5 2. read.csv read.csv('파일이름', header=T, stringsAsFactors=, as.is=, na.strings=)를 통해 CSV 파일을 읽는다 header=T를 하면 맨 첫줄을 변수명으로 인식함 > student str(student) 'data.frame':7 obs. of 5 variables: $ Name : chr "Jane" "Julia" "Tom" "Mike" ... $ Age : int 21 22 25 22 23 21 26 $ Height : int 168 157 178 182 1..

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편2

1. 논리연산 Python이랑 동일함 ==은 서로 같음 != 은 서로 같지 않음 a = b는 a가 b보다 크거나 같다 2. 기본 수학 연산자 + , - , * , / 으로 더하기 빼기 곱하기 나누기 ^ 으로 n제곱 연산 > 5^3 [1] 125 > 5+3 [1] 8 > 5-3 [1] 2 > 5*3 [1] 15 > 12/3 [1] 4 > 12//3 Error: unexpected '/' in "12//" 3. 특수 논리 연산자 ! 은 부정연산 & 는 and 연산 | 은 or 연산 > 3 == 5 [1] FALSE > !(3==5) [1] TRUE > TRUE & FALSE [1] FALSE > TRUE | FALSE [1] TRUE 4. 벡터 인덱..